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Procede de traitement d'une sequence sonore, telle qu'un 
morceau musical 

La presente invention concerne le traitement d'une 
5 sequence sonore, telle qu'un . morceau de musique ou, de 
fagon plus generale, une sequence sonore comportant la 
repetition d'une sous - sequence . 

Les distributeurs de productions musicales, par exemple 
10 enregistr<§es sur CD, cassette pu autre support, met tent a 
la disposition des clients potentiels des kiosques ou les* 
clients peuvent ecouter une musique de leur choix, ou 
encore des mugiques promues en raison de leur nouveaut£. 
Lorsqu'un client reconnait un couplet ou un refrain du 
15 morceau musical qu'il ecoute, il peut decider d'acheter la 
production musicale correspondante . 

De fagon plus g§n£rale, un auditeur d' attention moyenne 
concentre davantage son attention sur un enchainement de 

20 couplet et refrain, que sur 1 1 introduction du morceau, 
notamment . On comprendra ainsi qu'un resume sonore 
comportant au moins un couplet et un refrain suffirait 
pour etre diffuse dans des kiosques du type precite, 
plutot que prevoir la production musicale complete a 

25 diffuser. 

Dans une autre application telle que la transmission de 
donn^es sonores par t£l£phonie mobile, on comprendra que 
le tSlechargement du morceau de musique complet sur un 
30 terminal mobile, a partir d'un serveur distant, est 



10 



15 



WO 2005/004002 PCTYFR2004/001493 



beaucoup plus long et, de la, plus onereux que le 
telechargement d ! un resume sonore du type precite. 

De meme, dans un contexte de commerce electronique, ,des 
resumes sonores peuvent etre telecharges sur .un poste 
communiquant avec un serveur distant, via un reseau 6tendu 
du type INTERNET . L 1 utilisateur du poste informatique peut 
ainsi passer commande d'une production musicale dont 11 
apprecie le resume sonore. 

Toutefois, dttecter a 1' oreille un couplet et un refrain 
et creer ainsi un resume sonore pouy toutes les 
productions musicales distributes serait une tSche d'une 
lourdeur prohibitive. 

La presente invention vient ameliorer la situation. 



L'un des buts de la presente invention est de proposer une 
detection automatiste d'une sous-sequence rep6t6e dans une 
20 sequence sonore . 

Un autre but de la presente invention est de proposer une 
creation automat isee de resumes sonores du type decrit ci- 
avant . 
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30 



A cet effet, la presente invention porte d'abord sur un 
procede de traitement d'une sequence sonore, dans lequel : 
a) on applique une transform^ spectrale a ladite sequence 
pour obtenir des coefficients spectraux variant en 
fonction du .temps dans ladite sequence. 
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Le precede au sens de 1 ' invention comporte. en outre les 
etapes suivantes : 

b) on determine, par .analyse statistique desdits 
coefficients spectraux, au moins- une sous-sequence repetee 
dans, ladite sequence, et 

c) on lvalue des instants de debut et de fin de ladite 
sous -sequence dans la sequence sonore . 

Avantageusement, selon une etape supplemental^ : 

d) on extrait i a sous-sequence precitee pour stocker, dans 
une memoire, des echantillons sonores representant ladite- 
sous - sequence . ; 

Prefefentiellement, 1' extraction de 1- etape d) conceme au 
moins une sous-sequence dont la duree est la plus 
importante et/ou une sous -sequence dont la frequence de 
repetition est la plus importante dans ladite sequence. 

La presente invention trouve une application avantageuse 
dans 1-aide a la detection de def alliances de machines 
industrielles ou de moteurs, notamment en obtenant des 
sequences d • enregistrement sonore de phases d • acceleration 
et de deceleration du regime moteur. L • application du 
precede au sens de 1- invention permet d'isoler une sous- 
sequence sonore correspondant par exemple a un plein 
regime ou a une phase d • acceleration, cette sous-sequence 
etant, le cas echeant, comparee a une sous -sequence de 
reference . 



30 



Dans une autre application avantageuse a l'obtention de 
donnees musicales du type decrit ci-avant, la sequence 
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sonore precitee est un morceau de musique comportant une 
succession de sous -sequences parmi au moins une 
introduction, un couplet, un refrain, un pont de 
transition, un theme, un motif, ou un mouvement qui se 
repete dans la sequence. 

A l'etape c) , on determine pref erentiellement au moins les 
instants respect if s de debut et de fin d'une premiere 
sous-sequence et d'une seconde sous -sequence . 
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Dans une realisation particulierement avantageuse, a 
l'etape d) , on extrait alors une premiere et une. seconde 
sous-sequence pour obtenir, sur un support memoire, un 
resume sonore dudit morceau de musique comportant au moins 
la premiere sous-sequence enchainee avec la seconde sous- 
15 sequence . 

PrSf erentiellement, la premiere sous-sequence correspond a 
un couplet et la seconde sous -sequence correspond a 
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un 
refrain. 



Toutefois, il peut advenir que des premiere et seconde 
sous -sequences, extraites d'une sequence sonore, ne soient 
pas contigues dans le temps. 

A cet effet, on prevoit en outre les etapes suivantes : 
dl) detecter au moins une cadence de la premiere sous- 
sequence et/ou de la seconde sous-sequence pour estimer la 
duree moyenne d'une mesure a ladite cadence, ainsi qu'au 
moins un segment de fin de la premiere sous-sequence et au 
moins un segment de debut de la seconde sous -sequence, de 
durees respectives correspondant sensiblement a ladite 
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duree '. moyenne et isoles dans - la sequence .d f un nombre 
entier de durees moyennes, 

d2) . generer au moins une .mesure de transition de duree 
correspondant a ladite duree 1 ; moyenne et comportant une 
5 addition des echantillons -sondres 'd'au moins ledit segment 
de fin et d'au moins ledit segment de debut, 
d3) et concatener la premiere ' sous -sequence, la • ou les 
mesures de transition et la seconde sous-sequence pour 
obtenir 1 ' enchainement de la premiere et de la seconde 
10 sous - sequence . 

On constatera que la succession des Stapes dl) a d3) 
trouve, au-dela de la generation automatique de resumes 
sonores, une application avantageuse a la creation 

15 musicale assistee par orcliriateur . Dans cette application, 
un utilisateur peut creer lui-meme deux sous -sequences 
d'un morceau musical, tandis qu'un logiciel comportant des 
instructions pour derouler les etapes dl) a d3) assure un 
enchainement des deux sous -sequences par concatenation, 

20 sans artefact et agreable a l'oreille. 

De fagon plus generale, la presente invention vise aussi 
un produit programme d 1 ordinateur , stocke dans une memoire 
d 1 ordinateur ou sur un support amovible propre a cooperer 
25 avec un lecteur homologue d ' ordinateur , et comportant des 
instructions pour derouler les etapes du procede au sens 
de l 1 invention. 

D'autres caracteristiques et avantages de 1" invention 
30 apparaitront a l'examen de la description detaillee ci- 
apres, et des dessins annexes sur lesquels : 
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- la figure la represente un signal audio d f un morceau 
de musique correspondant , dans l'exemple represente, 
a une chanson de variety ; 

- la figure lb represente la variation d'energie 
spectrale en fonction du temps, pour le morceau de 
musique dont le signal audio est represents sur la 
figure la ; 

- la figure lc illustre les durees occupies par les 
differents passages du morceau de musique de la 
figure la et qui se repetent dans ce morceau ; 

- la figure 2 represente schematiquement des fenetres 
temporelles select ionnees dans deux parties 
respectiyes du morceau musical pour preparer la 
concatenation de ces deux parties, selon . la 
succession des e tapes dl) a d3) ci-avant ; 

- la figure 3a reprgsente schematiquement des segments 
Si(t) et Sj (t) silectionnes dans les parties 
respect ives du morceau precitees, pour preparer une 
concatenation des deux parties par super- 
position/addition ; 

- la figure 3b illustre schematiquement par le signe 
" © " la superposition/addition precitee ; 

- la figure 4 illustre une fenetre temporelle pour la 
concatenation precitee, de forme et de largeur 
prefer^es ; et 

- la figure 5 represente un organigramme de traitement 
d'une sequence sonore, dans un mode de realisation 
prefere de la prisente invention. 

Le signal audio de la figure la represente 1 1 intensite 
sonore (en ordonnles) en fonction du temps (en abscisses) 
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d'un morceau musical (ici, le morceau "head over feet"® de 
l 1 artiste Alanis Morissette) . Pour construire ce signal 
audio, les signaux respectifs des voies droite et gauche 
(en mode stereophonique) ont ete synchronises . et 
5 additionnes. 

Au signal audio represents sur la figure la, on applique 
une transformee spectrale (par exemple de type transf ormee 
de Fourier rapide FFT) pour obtenir une variation 
0 temporelle de l'energie spectrale du type represent^ sur 
la figure lb. 

Dans un mode de realisation, il s'agit d'une plurality de 
FFT a court terme, successives, dont le r€sultat . est 

5 applique & un banc de filtres sur plusieurs gammes de 
frequences (pref erentiellement de largeurs de bande 
croissantes comme le logarithmique de la frequence) . Une 
autre transformee de Fourier est ensuite appliquee pour 
obtenir des parametres dynamiques du signal audio 

0 (references PD sur la figure lb) . En particulier, 
l'Schelle en ordonnees de la figure lb indique 1" amplitude 
des variations des composantes a differentes vitesses dans 
un domaine de frequences donne . Ainsi, l'indice 0 ou 2 de 
l'echelle arbitraire en ordonnees de la figure lb 

5 correspond a une variation lente dans les basses 
frequences, tandis que 1 1 indice 12 de cette meme echelle 
correspond a une variation rapide dans les hautes 
frequences . Ces variations sont exprimSes en f onction du 
temps, en abscisses (secondes) . Les intensity associees a 

> ces parametres dynamiques PD, au cours du temps, sont 
illustrees par differents niveaux de gris dont les valeurs 
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relatives- sont indiguees par la- colonne de reference COL 
(a droite de la figure lb) . • 

On indigue que les param'dtres dynamiques du type 
represents sur la figure lb . permettent d 1 identifier 
completement un morceau de musique. Dans ce contexte 
d' "empreinte" d'un morceau de ■ musique, la demande FR- 
2834363 de la Demanderesse decrit de facon detaillee ces 
parametres- et la maniere de les'obtenir. 

En variante, les variables deduites du signal audio et- 
permettant de caracteriser le ." morceau de musique peuvent 
etre 'de type different, notamment des coefficients dits 
"Mel Frequency Cepstral Coefficients" . Globalement, on 
indique que ces coefficients (connus en soi) sont encore 
obtenus par transformee de Fourier rapide, & court terme. 



La figure lc offre une representation visuelle de 
1' evolution de l'energie spectrale de la figure lb. Sur la 
figure lc, l'abscisse represente le temps (en secondes) et 
les ordonnees representent les differentes parties du 
morceau, tels que les couplets, les refrains, 
1 'introduction, un theme, ou autres. La repetition au 
cours du temps d'une partie similaire, tel qu'un couplet 
ou un refrain, est representee par des rectangles grises 
qui apparaissent a differentes abscisses dans le temps (et 
qui peuvent etre de largeurs temporelles differentes) , 
mais de m§me ordonnees. Pour passer de la representation 
de la figure lb a la representation de la figure lc, on 
30 met en ceuvre une analyse statistique en utilisant par 
exemple l'algorithme des " K-means " , ou encore l'algorithme 
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"FUZZY K-means", on encore une chalne de Markov cachee, 
avec un apprentissage par 1 1 algorithme BAUM- WELSH, suivi 
d'une Evaluation par 1' algorithme de VITERBI . 

5 Typiguement , la determination du nombre d'etats' (les 
parties du morceau de musique) qui sont necessaires a la 
representation d'un morceau de musique s'effectue de fagon 
automatisee, par comparaison de . la similarity des etats 
trouves a chaque iteration des algorithmes precit<§s, et en 
10 eliminant les Etats redondants. Cette technique, dite de 
"pruning" permet ainsi d'isoler chaque partie redondante 
du morceau de musique et de determiner ses coordonnees 
temporelles (ses instants de debut et de fin, comme 
indique ci-avant) . 

15 

Ainsi, on etudie les variations, par exemple dans les 
frequences tonales (d'une voix humaine) , de l'energie 
spectrale pour determiner la repetition d'un passage 
musical particulier dans le signal audio. 

20 

Preferentiellement, on cherche a extraire un ou plusieurs 
passages musicaux dont la duree est la plus importante 
dans le morceau de musique et/ou dont la frequence de 
repetition est la plus importante. 

25 

Par exemple, pour la plupart des morceaux de variete, on 
pourra choisir d'isoler les parties de refrain, dont la 
repetition est gEneralement la plus frEquente, puis les 
parties de couplet, dont la repetition est frequente, 
30 puis, le cas echeant, d'autres parties encore si elles se 
repetent . 
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On indique que d'autres . types de sous -sequences 
representatives du morceau de musique peuvent etre 
extraites., dds lors que ces sous r sequences . se repetent 
dans le morceau de musique.' Par. exemple, on peut choisir 
d'extraire un motif musical-, g'eneralement de plus courte 
duree. qu'un couplet ou un refrain, tel qu'un passage.de 
percussions repete dans le morceau de musique, ou encore 
une phrase" vocale scandee plusi'eurs fois dans le morceau. 
En outre, un theme peut aussi ; §tre extrait du morceau de 
musique, par exemple une phrase musicale repetee dans un' 
morceau de jazz ou de musique classique. En musique 
classique, un . passage tel qu'un mouvement peut en outre 
etre extrait . 

Sur le resume visuel represents a titre d' exemple sur la 
figure lc, les rectangles grises indiquent la presence 
d'une partie du morceau telle que 1 ' introduction 
("intro"), d'un couplet ou d'un refrain dans une fen§tre 
temporelle indiquee par l'abscisse temporelle (en 
secondes) . Ainsi, entre 0 et environ 15 secondes, le 
morceau de musique demarre par une introduction (indexee 
par le chiffre 2 sur l'echelle en ordonnees) . 
L* introduction est suivie de deux alternances de couplet 
(indexS par le chiffre 3) et de refrain (indexe par le 
chiffre 1) jusqu'a environ 100 secondes. 

On se refere maintenant a la figure 5 pour decrire les 
etapes principales du procede pour obtenir le resume 
sonore precit€, selon un mode de realisation prefere. Tout 
d'abord, on obtient les signaux audio sur la voie gauche 
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"audio L" et sur la voie droite "audio R» aux Stapes 
respectives 10 et 11, lorsque la sequence sonore initiale 
est representee en mode stereophonique . Les signaux de ces 
deux voies sont additionnes a l'etape 12 pour obtenir. un 
signal audio du type represents sur la figure la. Ce 
signal audio est, le cas echeant, stocke sous forme 
echantillonnee dans une memoire de travail ' avec des 
valeurs d' intensity sonores rangees en fonction de leurs 
coordonnees temporelles associees (etape 14) . a ces 
donnees audio, on applique une transformee spectrale (de 
type FPT dans l'exemple represents ) , a l'etape 1.6, pour 
obtenir, a l'etape 18, les coefficients spectraux Fi(t) 
et/ou leur variation AFi(t) en fonction du temps. A 
l'etape 20, un module d'analyse statistique opere sur la 
base des coefficients obtenus a l'etape 18 pour isoler des 
instants t 0 ,t a ,...,t 7 qui correspondent a des instants de 
debut et de fin des differentes sous -sequences qui se 
repetent dans le signal audio de l'etape 14. 



Dans l'exemple represents, le morceau de musique presente 
une structure (classique en variete) du type comportant : 

- une introduction dans le debut du morceau entre un 
instant t 0 et un instant t lf 

- un couplet entre t x et t 2 , 

- un refrain entre t 2 et t 3 , 

- un second couplet entre t 3 et t 4 , 

- un second refrain entre t 4 et t 5< 

- une introduction, a nouveau, le cas echSant 
agrementee d'un solo instrumental, entre les instants 

30 t s et t 6 , et 
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- la repetition de deux 'refrains de fin. de morceau 
entre les instants t 6 ' et t 7 . 

A l'etape 22, les instants tj> '.a t 7 sont repertories et 
indexes en fonction du • passage- musical correspondant 
(introduction, couplet ou refrain) et stockes, le cas 
echeant, dans une memoire de travail. A l'etape -23, .on 
peut construire alors un resume visuel de ce morceau de 
musique, tel que represents sur 'la' figure 5. 

i ■ • 

Dans l'exemple decrit ci-avant d'un morceau de varie'te- 
comportant une structure typique, on construit le resume 
sonore a partir d'un couplet extrait du morceau, suivi 
d'un refrain extrait du morceau. A l'etape 24, on prepare 
une concatenation des echantillons sonores du signal audio 
entre les instants t x et t 2 , d'.une part, et entre les 
instants t 2 et t 3 , d' autre part, dans l'exemple decrit. Le 
cas echeant, le resultat de cette concatenation est 
memorise dans une memoire permanent e MEM pour une 
utilisation ulterieure, a l'etape 26. 

Toutefois, en regie generale, 1 • instant de fin d'un 
couplet isole et 1 • instant de debut d'un refrain isole ne 
sont pas forcement identiques, ou encore, on peut choisir 
de construire le resume sonore a partir du premier couplet 
et du second refrain (entre t 4 et t 5 ) ou du refrain de fin 
(entre t 6 et t 7 ) . Ainsi, les deux passages selectionnes 
pour construire le resume sonore ne sont pas forcement 
contigus . 
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Une concatenation aveugle de signaux sonores. correspondent 
a deux parties d'un morceau de. musique donne un ressenti 
desagreaple a l'oreille. On.decr.it ci-apres, en reference 
aux figures 2, 3a, 3b et 4, 'la construction d'un signal 
5 sonore par- concatenation de" deux parties d'un morceau de 
musique, de maniere a surmonter' ce probleme.. 

L'un des buts de cette construction par concatenation est 
de preserver localement le tempd du signal sonore. 

Un autre b,ut est d' assurer une distance temporelle entre • 
points de concatenation (ou points d • "alignement" ) egale a 
un multiple entier de la duree d'une mesure. 

15 Preferentiellement, cette concatenation s'effectue par 
superposition/addition de segments sonores choisis et 
isoles des deux parties respectives precitees du morceau 
de musique . 
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20 On decrit ci-apres une superposition/addition de tels 
segments sonores, dans un premier temps par 
synchronisation de beat (dite "beat-synchrone") , puis par 
synchronisation de mesure selon une realisation preferee. 

25 On note ci-aprds : 

- bpm, le nombre de beats par minute d'un morceau de 
musique, 

- D, la reference de ce nombre bpm (par exemple dans le 
cas d'un morceau note "120=noire" , bpjn=120 et 

30 D=noire) , 
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- T, la duree (exprimee en secondes) d'un beat, c'est- 
a-dire de la reference D : dans 1 ' exemple. precedent 
ou D=noire, on a 

T _ 60 
bpm 

5 - N, le numerateur de la metrique du morceau de musique 

(par exemple, dans le cas d'une mesure not£e "3/4", 
N=3), 

- M, la duree (exprimee en secondes) d'une mesure, 
donnee par la relation M=N.T (soit M=3*60/120 dans 

10 I 1 exemple precedent), 

s(t), le signal audio d'un morceau de musique, 
5(0 , le signal reconstruit par super- 

position/addition, et 

- si(t) et Sj(t), les i drae et j^ me segments qui 
15 comportent des signaux audio respectifs appartenant a 

un premier et " S. un second passage d'un morceau de 
musique, et qui sont utilises pour la construction de 
S(t) par superposition/addition. 

20 En principe, les premier et second passages precites ne 
sont pas contigus. s(t) est alors obtenu comme suit. 

En se referant a la figure 2, les segments si(t) et Sj (t) 
sont d'abord formes par d€coupage du signal audio & I'aide 

25 d'une fenetre temporelle h L (t), de largeur L et definie 
(de valeur non nulle) entre 0 et L. Cette fenetre peut 
etre de type rectangulaire , de type dit "de harming", de 
type dit "de harming en palier" , ou autre. En se referant 
a la figure 4, un type prdfere de fenetre temporelle est 

30 obtenu par concatenation d'un flanc montant, d'un pallier 
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et d'un flanc descendant. .La largeur temporelle pref§ree 
de cette fen§tre est indicju^e ci-a£res. 

•• • ,i • 

On definit alors le premier segment : Si (t) de sorte que : 
5 *i(0 = ^ + w,)^(jf)' [1] . 

oii mi est 1' instant de d^but ;du premier segment. 

Comme le montre la figure 3a, on construit Sj (t) 
sensibXemeht de la m§me manie're : 

10 ' = Jfr + «y)ii(0 [Ibis] 

ou mj est i 1 instant de debut du second segment. 

Meme pi la duiree L de la fenetre temporelle est la meme 
pour les deux segments, on indique toutefois que la forme 
de la fenetre peut etre • dif f erehte d'un segment s±(t) a 
1 ! autre sj (t) , comme le montre d'a'illeurs la figure 2. 
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Soit bi et bj deux positions respectives a 1 1 int^rieur des 
premier et second segments, appelees "positions de 
synchronisation", par rapport auxquelles s'effectue la 
superposition/addition, telles que : 

0 < bi < L et 0 < bj < L [2] 

Avantageusement, la distance temporelle entre b ± et bj est 
25 choisie egale a un multiple entier de la duree T d'un beat 
(bj - bi = kT) . Dans ces conditions, on dit qu'il y a 
reconstruction " beat -synchr one" si 

5(0 = 2^ , (/-(i-l)(A: , J) + C ) [4] 
avec s' £ (t) = Si(t+bi) [5] 
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et ou k' est le plus grand entier tel que k'T ^ L- (bi-m±) , 
c est une constante de temps telle que c = Jb 2 -m a .. 
Avantageusement, la distance entre les instants mi ' et m, 
est choisie egale a un multiple entier de k 'NT, dans 
lequel N designe le numerateur de la metrique. ' 

Ainsi, le signal reconstruit s'ecrit : 

*(0 = - C-l) • (k'NT)+c) 

i 

On obtient alors une superposition/addition synchrone a la 
mesure. La figure 3b illustre cette situation. On remarque 
sur la figure 4 que la largeur L de la fenetre temporelle 
precitee est voisine de k 1 NT (aux flancs montant et 
descendant pres) . Toutefois, on choisira 

preferentiellement dans ce cas des rampes de flancs telles 
que k'T £ L-2(h ± -mi).. 

Plus particulierement, on choisit les instants m, et mj de 
sorte qu-ils correspondent a des premiers temps de 
mesures. Dans ces conditions, on obtient avantageusement 
une superposition/addition beat -synchrone dite "alignee" . 

Ainsi, en determinant en outre la metrique du premier 
passage et/ou du second passage, on peut effectuer une 
reconstruction beat -synchrone a la mesure. Si, de plus, on 
choisit les premier et second segments de sorte qu'ils 
commencent par un premier temps de mesure, cette 
reconstruction beat -synchrone est alignee. 
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On indique qu'une reconstruction du signal s(t) pent etre 
menee sur la base de plus • de. deux passages musicaux a 
concatener. Pour i passages musicaux <i>2) , la 
generalisation du procedg cii-avant s ' exprime par la 
relation : • 

m = s l \t + c) + s 2 \t-k x 'T + c) + s 2 \i-^T+k^T + c) + ... 

+Si'(.t+ y £(-iyk J 'T+c) 

i • 

i 

Chaque entier kj • est defini cbmme l'entier le plus grand, 
tel que kf'T £ Lj- (bj-mj) , ou correspond a la largeur de 
la fenetre du jeme passage musical a concatener. 

On indique que les premiers temps de mesure, ou encore la 
metrique, ou encore le tempo d'un morceau de musique, 
peuvent §tre detectes automat iquement, par- exemple en 
utilisant des applications logicielles existantes. Par 
exemple, la norme MPEG- 7 (Audio Version 2) prevoit la 
determination et la description du tempo et de la metrique 
d'un morceau de musique, en utilisant de telles 
applications logicielles. 

Bien entendu, la presente invention ne se limite pas a la 
forme de realisation decrite ci-avant a titre d' exemple ; 
elle s'etend a d'autres variantes . 



25 Ainsi, on comprendra que le resume sonore peut comporter 
plus de deux passages musicaux, par exemple une 
introduction, un couplet et un refrain, ou encore deux 
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passages differents d'un couplet et d'un refrain, tels que 
1 ' introduction et un refrain, par.exemple. 

On remarguera aussi que les Stapes representees sous forme 
d'organigramme sur la figure 5 peuvent etre implement ees 
par un logiciel inf ormatique dont 1 • algorithme. reprend 
globalement la structure de 1 ' organigramme . A ce* titre, la 
presente invention vise aussi un tel programme 
inf ormatique . 
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Revindications 



1. Procede de traitement d'une sequence sonore/ dans 
lequel : 

5 a) on applique une transformee spectrale a ladite sequence 
pour obtenir des coefficients spectraux variant en 
fonction du temps dans ladite sequence, 

caracterise en ce qu'il. comporte en outre les 
etapes suivantes : 
10 b) on determine, par analyse statistique desdits 
coefficients spectraux, au moins une sous - s equence. repe tee 
dans ladite sequence, et 

c) on evalue des instants de d£but et de fin de ladite 
sous-sequence dans la sequence sonore. 

15 

2. ProcSde' selon la revendication 1, caracterise en ce 
qu'il comporte en outre une etape : 

d) d' extraction de la sous -sequence pour stocker, dans une 
memoire, des echantillons sonores repr^sentant ladite 

20 sous - sequence . 

3. Procede selon la revendication 2, caracterise en ce que 
1- extraction de 1 ' gtape d) concerne au moins une sous- 
sequence dont la duree est la plus importante et/ou une 

25 sous-sequence dont la frequence de repetition est la plus 
importante dans ladite sequence. 



30 



4. Procede selon l'une des revendications 1 a 3, dans 
lequel la sequence sonore est un morceau de musique 
comport ant une succession de sous -sequences parmi au moins 
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une introduction, un couplet, - un refrain, un pont de 
transition, un theme, un motif, uri mouvement, 

caracterise en ce que, a.l'etape c) , on determine 
au moins les instants respectifs de debut et de fin d'une 
5. premiere sous-sequence et d'une seconde sous - sequence . 

5. Procede selon la revendication • 4 , prise en cdmbinaison 
avec la revendication 3, caracterise en ce que la premiere 
sous -sequence correspond a un couplet et la seconde sous- 
sequence correspond a un refrain. 

6. Procede selon l'une des revendications 4 et 5, prises 
en combinaison. avec la revendication 2, caracterise en ce 
que, a l'etape d) , on extrait une premiere et une seconde 
sous -sequence pour obten'ir, sur un support memoire, un 
resumS sonore dudit morceau de musique comportant au moins 
la premiere sous - sequence enchalnee avec la seconde sous- 
sequence . 



10 



15 



7. Procede selon la revendication 6, dans lequel les 
extraits des sous -sequences sont non contigus dans le 
temps, caracterise en ce qu'il comporte en outre les 
etapes suivantes : 

dl) detecter au moins une cadence de la premiere sous- 
sequence et/ou de la seconde sous-sequence pour estimer la 
duree moyenne d'une mesure a ladite cadence, ainsi qu'au 
moins un segment de fin de la premiere sous-sequence et au 
moins un segment de debut de la seconde sous -sequence, de 
durees respectives correspondant sensiblement a ladite 
duree moyenne et isoles dans la sequence d'un nombre 
entier de durees moyennes, 
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d2.) generer au moins une mesure de transition de durge 
correspondant a ladite duree moyenne et compqrtant une 
addition des echantillons sonores d.'au moins ledit segment 
de fin et d'au moins ledit segment de debut, 
d3) et concatener la premiere sous- sequence, la oil les 
mesures de transition et la seconde sous-sequence pour 
obtenir un enchainement de la premiere et de la seconde 
sous- sequence . 

8. Procede selon la revendication 7, caracterise en ce que 
l'etape dl) comporte un decoupage en au moins deux 
fenetres, de type rectangulaire, de type de Hanning, de 
type de Hanning en palier, ou pref erentiellement de type 
comportant un flanc montant, un pallier et un flanc 
descendant dans le temps. 

9. Procede selon l'une des revendications 7 et 8, 
caracterise en ce que l'6tape d2) comporte une 
reconstruction beat-synchrone. 

10. Procede selon la revendication 9, caracterise en ce 
que, a l'etape dl) , on determine en outre la metrique de 
la premiere sous -sequence et/ou de la seconde sous- 
sequence, et en ce que l'etape d2) comporte une 
reconstruction beat-synchrone a la mesure. 

11. Procede selon l'une des revendications 9 et 10 , 
caracterise en ce que, a 1 '<§tape dl) , on determine lesdits 
segments de fin et de debut de sorte qu^ls commencent par 
un premier temps de mesure, et en ce que l'etape d2) 
comporte une .reconstruction beat-synchrone alignee. 
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12. Produit programme d ' ordinateur , stocks dans une 
memoire d • ordinateur. ou sur . un ''support amovible - propre a 
cooperer avec un lecteur d 'ordinateur, caracterise en ce 
qu'il comporte des instructions pour derouler les' etapes 
du procede selon l'une des revindications precedentes. 
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